Invoke data set Mode from package mlogit. To do this you need to first load the package. This is a data set with choices about mode of transportation. This is done as follows:

(Invocar el modo de conjunto de datos desde el paquete mlogit. Para ello, primero debe cargar el paquete. Se trata de un conjunto de datos con opciones sobre el modo de transporte. Esto se hace de la siguiente manera)

data("Mode")

Once you have loaded the data set, answer the following questions: Describe this data set. How many variables are there and of which type (i.e., categorical/quantitative)?

(Una vez que haya cargado el conjunto de datos, responda a las siguientes preguntas: Describa este conjunto de datos. ¿Cuántas variables hay y de qué tipo (es decir, categóricas/cuantitativas)?)

glimpse(Mode)
## Rows: 453
## Columns: 9
## $ choice       <fct> car, rail, car, car, car, car, car, car, bus, car, rail, …
## $ cost.car     <dbl> 1.5070097, 6.0569985, 5.7946769, 1.8691439, 2.4989523, 4.…
## $ cost.carpool <dbl> 2.3356118, 2.8969191, 2.1374543, 2.5724266, 1.7220099, 0.…
## $ cost.bus     <dbl> 1.800512, 2.237128, 2.576385, 1.903518, 2.686000, 1.84765…
## $ cost.rail    <dbl> 2.358920, 1.855450, 2.747479, 2.268276, 2.973866, 2.31005…
## $ time.car     <dbl> 18.503200, 31.311107, 22.547429, 26.090282, 4.699140, 3.0…
## $ time.carpool <dbl> 26.338233, 34.256956, 23.255171, 29.896023, 12.414084, 9.…
## $ time.bus     <dbl> 20.86779, 67.18189, 63.30906, 19.75270, 43.09204, 12.8256…
## $ time.rail    <dbl> 30.03347, 60.29313, 49.17164, 13.47268, 39.74325, 43.5442…

La variable ‘choice’ es de tipo categórico, mientras que las otras ocho variables son de tipo cuantitativo.

How many different modes of transportation are in this data set? What is the most popular mode? What is the least popular mode?

(¿Cuántos modos de transporte diferentes hay en este conjunto de datos? ¿Cuál es el modo más popular? ¿Cuál es el modo menos popular?)

summary(Mode)
##      choice       cost.car       cost.carpool       cost.bus    
##  car    :218   Min.   :0.4099   Min.   :0.1293   Min.   :1.013  
##  carpool: 32   1st Qu.:3.6964   1st Qu.:0.9519   1st Qu.:1.783  
##  bus    : 81   Median :4.8796   Median :1.6665   Median :2.027  
##  rail   :122   Mean   :4.8735   Mean   :1.6863   Mean   :2.036  
##                3rd Qu.:6.2255   3rd Qu.:2.4581   3rd Qu.:2.321  
##                Max.   :8.8555   Max.   :3.2953   Max.   :2.740  
##    cost.rail        time.car       time.carpool       time.bus     
##  Min.   :1.272   Min.   : 2.404   Min.   : 8.385   Min.   : 1.969  
##  1st Qu.:1.947   1st Qu.:21.835   1st Qu.:28.391   1st Qu.:25.457  
##  Median :2.198   Median :37.497   Median :40.637   Median :41.415  
##  Mean   :2.212   Mean   :37.044   Mean   :39.771   Mean   :39.923  
##  3rd Qu.:2.476   3rd Qu.:53.104   3rd Qu.:51.843   3rd Qu.:52.805  
##  Max.   :3.113   Max.   :66.871   Max.   :65.009   Max.   :75.681  
##    time.rail     
##  Min.   : 4.621  
##  1st Qu.:28.143  
##  Median :40.034  
##  Mean   :39.505  
##  3rd Qu.:49.172  
##  Max.   :73.998

Existen cuatro modos de transporte (automóvil, coche compartido, autobús y tren), siendo el automóvil el más utilizado con 218 observaciones, y el coche compartido el menos utilizado con 32 observaciones.

ggplot(Mode)+
  geom_bar(aes(choice, fill=choice), color="dodgerblue", show.legend = FALSE)+
  theme_bw()

In general, what is the most expensive mode? The least expensive?

(En general, ¿cual es el modo más caro? ¿La menos cara? )

ggplot(Mode)+
  geom_density(aes(cost.car, fill="car"), color="black", alpha=0.5)+
  geom_density(aes(cost.carpool , fill="carpool"), color="black", alpha=0.5)+
  geom_density(aes(cost.bus, fill="bus"), color="black", alpha=0.5)+
  geom_density(aes(cost.rail, fill="rail"), color="black", alpha=0.5)+
  scale_fill_manual(values=c("car"= "red", "carpool"="yellow", "bus"="blue", "rail"="cyan"), name="Mode")+
  xlab("Cost")+
theme_bw()

El automóvil representa el medio de transporte más costoso, mientras que el carpool es la alternativa más económica.

Create a plot showing the univariate distributions of time by car and time by bus. Discuss.

(Crea un gráfico que muestre las distribuciones univariantes del tiempo en coche y el tiempo en autobús. Discute)

grafica_time <- ggplot(Mode)+
  geom_density(aes(time.car, fill="car"), color="black", alpha=0.5)+
  geom_density(aes(time.carpool , fill="carpool"), color="black", alpha=0.5)+
  geom_density(aes(time.bus, fill="bus"), color="black", alpha=0.5)+
  geom_density(aes(time.rail, fill="rail"), color="black", alpha=0.5)+
  scale_fill_manual(values=c("car"= "red", "carpool"="yellow", "bus"="blue", "rail"="cyan"), name="Mode")+
  xlab("Time")+
theme_bw()


ggplotly(grafica_time)  

El automóvil ofrece mayor rapidez, mientras que el autobús y el tren pueden presentar riesgos de mayores demoras.

How do choices relate to cost by the different modes?

(¿Cómo se relacionan las opciones con el coste de los distintos modos?)

varnum <- Mode |> dplyr::select(where(is.numeric))
varnum <- names(varnum)

for (var in varnum) {
grafica_box <- ggplot(Mode)+
  geom_boxplot(aes(choice, eval(as.name(var)), fill=choice), show.legend=FALSE)+
  ylab(var)+
  theme_bw()
  
  print(grafica_box)
    
}

El carpool y el autobús son opciones preferidas debido a sus menores costos, aunque el automóvil, aunque más rápido, resulta ser más costoso.